National Repository of Grey Literature 27 records found  1 - 10nextend  jump to record: Search took 0.00 seconds. 
Bioinformatic Tool for Classification of Bacteria into Taxonomic Categories Based on the Sequence of 16S rRNA Gene
Valešová, Nikola ; Hon, Jiří (referee) ; Smatana, Stanislav (advisor)
Tato práce se zabývá problematikou automatizované klasifikace a rozpoznávání bakterií po získání jejich DNA procesem sekvenování. V rámci této práce je navržena a popsána nová metoda klasifikace založená na základě segmentu 16S rRNA. Představený princip je vytvořen podle stromové struktury taxonomických kategorií a používá známé algoritmy strojového učení pro klasifikaci bakterií do jedné ze tříd na nižší taxonomické úrovni. Součástí práce je dále implementace popsaného algoritmu a vyhodnocení jeho přesnosti predikce. Přesnost klasifikace různých typů klasifikátorů a jejich nastavení je prozkoumána a je určeno nastavení, které dosahuje nejlepších výsledků. Přesnost implementovaného algoritmu je také porovnána s několika existujícími metodami. Během validace dosáhla implementovaná aplikace KTC více než 45% přesnosti při predikci rodu na datových sadách BLAST 16S i BLAST V4. Na závěr je zmíněno i několik možností vylepšení a rozšíření stávající implementace algoritmu.
Detection of Enzymes in Metagenomic Data
Smatana, Stanislav ; Martínek, Tomáš (referee) ; Hon, Jiří (advisor)
This thesis presents specification and implementation of a system for detection of enzymes in metagenomic data. The detection is based on a provided enzyme sequence and its goal is to search the metagenomic sample for its novel variants. In order to guarantee that found enzymes truly have the desired catalytic function, the system employs a number of catalytic function verification methods. Their specification, implementation and evaluation is one of the main contributions of this thesis. Experiments have shown, that proposed methods reach sensitivity as high as 89%, specificity of 95%, values of AUC metric above 0.9 and average throughput of 1,203 verifications per second on regular personal computer. Evaluation of the system also led to discovery of a partial sequence of novel haloalkane dehalogenase enzyme in a metagenomic sample from soil. The implementation is able to work on a personal computer as well as on a grid computing environment.
Methods of processing Oxford Nanopore sequencing data for metagenomics
Barilíková, Lujza ; Provazník, Ivo (referee) ; Kupková, Kristýna (advisor)
The revolutionary sequencing technology introduced by Oxford Nanopore Technologies – MinION holds a great promise in the field of metagenomics. Low cost, produced long reads and portability, due to its small dimensions, represents only one of the many advantages of this technology. Despite the benefits, there is a lack of available computational tools for handling the produced data. The theoretical part of the thesis first introduces current sequencing technologies with main focus on the third-generation sequencing and especially on nanopore sequencing. The recent possibilities of metagenomic data visualization are introduced. The main purpose of the bachelor thesis is to make an algorithm for binning of metagenomic samples based on use of dimensionality reduction techniques straight on raw data produced by nanopore sequencing.
Web Application for Primer Selection for 16S rRNA Amplicon Sequencing
Jurča, Jan ; Martínek, Tomáš (referee) ; Smatana, Stanislav (advisor)
Main goal of this thesis was an implementation of web application, that can evalutate and recommend primer pairs for 16S rRNA amplicon sequencing, according to users specific needs and by this simplify the procces of primer pair selection. Primer pair evaluation is based on database of primer pairs, which contains data about senzitivity and specifity of each primer pair. Part of the work was also the performance optimization of the primer pair analysis algorithm, that computes senzitivity and specifity data. This optimization helped in an integration of algorithm into the application, which means that users can submit their own primer pair sequences, run analysis and get informations about position of amplified region, sensitivity and specifity.
Tool for Classification of Lifestyle Traits Based on Metagenomic Data from the Large Intestine
Kubica, Jan ; Hon, Jiří (referee) ; Smatana, Stanislav (advisor)
This thesis deals with analysis of human microbiome using metagenomic data from large intestine. The main focus is placed on bacteria composition in a sample on different taxonomic levels regarding the lifestyle traits of an individual. For this purpose, a tool for classification of several attributes was created. It considers attributes like diet type and eating habits (vegetarian, vegan, omnivore), gluten and lactose intolerance, body mass index, age or sex. From range of machine learning perspectives considering K Nearest Neighbours (kNN), Random Forest (RF) and Support Vector Machines (SVM) were used. Datasets for training and final evaluation of the classifier were taken from American Gut project. The thesis also focuses on particular problems with metagenomic datasets like its multidimensionality, sparsity, compositional character and class imbalance.
Tool for Visualization of Microbiome Data
Mišáková, Silvia ; Martínek, Tomáš (referee) ; Smatana, Stanislav (advisor)
Táto práca sa zameriava na vytvorenie nového nástroja pre vizualizáciu mikrobiomových dát. Vytvorený nástroj používa pre redukciu dimenzií analýzu hlavných komponent (PCA) a analýzu hlavných súradníc (PCoA). V prípade výpočtu dištančnej matice sú použité metriky Bray-Curtis odlišnosť a UniFrac. Spracované dáta sú následne ofarbené na základe užívateľom zvolených metadát. Výsledky sú prezentované pomocou dvoch typov grafov. Prvý z nich je stĺpcový a zobrazuje podiel každej hlavnej zložky. Druhý, bodový graf, vizualizuje konečný výsledok požadovanej analýzy. V rámci práce bola pridaná možnosť stiahnuť si vypočítanú maticu a taktiež tabuľku prvých N hlavných zložiek vypočítaných danou analýzou.
Bacteria Classification Based on Marker Genes
Pelantová, Lucie ; Hon, Jiří (referee) ; Smatana, Stanislav (advisor)
The aim of this work is proposal of new method for bacteria classification based on sequences of marker genes. For this purpose was chosen 10 marker genes. Resulting MultiGene classifier processes data set by dividing it in several groups and choosing gene for each group which can distinguish this group with best results. This work describes implementation of MultiGene classifier and its results in comparison with other bacteria classifiers and with classification based entirely on gene 16S rRNA.
Detection of chimeras in amplicon sequencing
Heřmánková, Kristýna ; Jurečková, Kateřina (referee) ; Sedlář, Karel (advisor)
Chimeric sequences are the most common artifacts that can occur in sequencing data after the sample amplification using the polymerase chain reaction. The presence of these artifacts can negatively affect results of the analysis. Therefore, the detection and subsequent filtration of chimeric sequences is an important step in the computational processing of sequencing data. This work deals with the principle of chimera formation and the possibility of reducing their occurrence. The aim of this work is to implement an algorithm for chimeras detection in R language and testing its accuracy on data provided by the Veterinary Research Institute in Brno.
Methods for Comparative Analysis of Metagenomic Data
Sedlář, Karel ; Vinař,, Tomáš (referee) ; Lexa, Matej (referee) ; Provazník, Ivo (advisor)
Moderní výzkum v environmentální mikrobiologii využívá k popisu mikrobiálních komunit genomická data, především sekvenaci DNA. Oblast, která zkoumá veškerý genetický materiál přítomný v environmentálním vzorku, se nazývá metagenomika. Tato doktorská práce se zabývá metagenomikou z pohledu bioinformatiky, která je nenahraditelná při výpočetním zpracování dat. V teoretické části práce jsou popsány dva základní přístupy metagenomiky, včetně jejich základních principů a slabin. První přístup, založený na cíleném sekvenování, je dobře rozpracovanou oblastí s velkou řadou bioinformatických technik. Přesto mohou být metody pro porovnávání vzorků z několika prostředí podstatně vylepšeny. Přístup představený v této práci používá unikátní transformaci dat do podoby bipartitního grafu, kde je jedna partita tvořena taxony a druhá vzorky, případně různými prostředími. Takový graf plně reflektuje kvalitativní i kvantitativní složení analyzované mikrobiální sítě. Umožňuje masivní redukci dat pro jednoduché vizualizace bez negativních vlivů na automatickou detekci komunit, která dokáže odhalit shluky podobných vzorků a jejich typických mikrobů. Druhý přístup využívá sekvenace celého metagenomu. Tato strategie je novější a příslušející bioinformatické nástroje jsou méně propracované. Hlavní výzvou přitom zůstává rychlá klasifikace sekvencí, v metagenomice označovaná jako „binning“. Metoda představená v této práci využívá přístupu zpracování genomických signálů. Tato unikátní metodologie byla navržena na základě podrobné analýzy redundance genetické informace uložené v genomických signálech. Využívá transformace znakových sekvencí do několika variant fázových signálů. Navíc umožňuje přímé zpracování dat ze sekvenace nanopórem v podobě nativních proudových signálů.
Bioinformatic Tool for Estimation of Abundances of Bacterial Functional Molecules in Biological Samples Based on 16S rRNA Metagenomic Data
Bieliková, Michaela ; Hon, Jiří (referee) ; Smatana, Stanislav (advisor)
Ľudské telo je prostredím pre život neuveriteľného množstva mikróbov. Niektoré z nich môžu spôsobovať rôzne choroby, ale ďalšie, napríklad črevný mikrobióm, sú pre život a zdravie človeka nepostrádateľné. Nanešťastie, črevný mikrobióm nie je detailne preštudovaný, pretože obsahuje tisíce rôznych druhov baktérií, z ktorých väčšina sa nedá kultivovať v laboratórnych podmienkach. Riešením tohto problému sú nové rýchle metódy sekvenovania v kombináciou s bioinformatickými nástrojmi na výpočet funkčného profilu baktérií vo vzorke. V tejto práci si predstavíme existujúce nástroje predpovedajúce funkčný profil, a následne navrhneme nový nástroj, ktorý môže implementovať konsenzus nad výsledkami existujúcich nástrojov, alebo sa môže jednať o úplne nový nástroj.

National Repository of Grey Literature : 27 records found   1 - 10nextend  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.